Recherche de passages pertinents dans les fichiers logs par enrichissement de requêtes
نویسندگان
چکیده
The question answering systems are considered the next generation of search engines. This paper focuses on the first step of this process which is to search for relevant passages containing the responses. Such a task can be difficult because of the complexity of data, logs files in our case. Our contribution is based on enrichment of queries using a learning method based on the notion of "lexical world" and a novel term weighting function. This original weighting function, implemented within the enrichment process, aims to assign a high weight to terms that might be relative to the context of the answer. Experiments conducted on real data show that our protocol of primitive query enrichment allows to extract relevant passages. MOTS-CLÉS : Recherche d’Information, Système question réponse, Recherche de passage, enrichissement de requête, apprentissage de contexte
منابع مشابه
Recherche d'information. Analyse des résultats de différents systèmes réalisant la même tâche
RESUME: Les systèmes de recherché d’information visent à optimiser les résultats qu’ils fournissent en réponse à une requête de l’utilisateur. Les performances de ces systèmes sont généralement mesurées par rapport à des collections de test communes, comme les collections de TREC (Text REtrieval Conférence). Cette évaluation est réalisée de façon globale, en calculant une moyenne des résultats ...
متن کاملUn outil de détection automatique de thèmes
Vu la quantité de documents numériques disponible sur le Web et la nécessité de mettre au point des techniques de recherche efficaces, les systèmes de recherche d'information font de plus en plus appel aux techniques de Traitement Automatique des Langues (TAL) qui exploitent les informations syntaxiques ou sémantiques, dans le but d’améliorer la qualité des résultats fournis par les moteurs de ...
متن کاملRecherche d'information médicale pour le patient: Impact de ressources terminologiques
RÉSUMÉ. Le droit d’accès au dossier clinique par les patients est inscrit dans le code de Santé Publique. Cependant, ce contenu reste difficile à comprendre. Nous proposons une expérience, où les requêtes des patients sont utilisées pour retrouver les documents pertinents. Nous utilisons le moteur de recherche Indri, basé sur le modèle statistique de la langue, et des ressources sémantiques. L’...
متن کاملFusion de systèmes pour la recherche de passages dans des textes
RÉSUMÉ Les systèmes de recherche d’information (RI) présentent une grande variabilité dans la liste des documents qu’ils retrouvent en réponse à une même requête. Dans cet article nous étudions l’apport de la fusion des résultats des systèmes pour la RI. Ainsi, nous utilisons les résultats obtenus sur un ensemble de 50 requêtes par différents systèmes qui ont participé à la tâche TREC de sélect...
متن کاملUne nouvelle approche pour la recherche d'images par le contenu
Résumé. On utilise l’analyse factorielle des correspondances (AFC) pour la recherche d’images par le contenu en s’inspirant directement de son utilisation en analyse des données textuelles (ADT). L’AFC permet ici de réduire les dimensions du problème et de sélectionner des indicateurs pertinents pour la recherche par le contenu. En ADT, l’AFC est appliquée à un tableau de contingence croisant m...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2010